今天來說說卷積神經網絡(CNN)的圖像超分辨率方法SRCNN!
它可以從低分辨率的圖像中重建高分辨率的圖像。
SRCNN的設計比較簡單,主要由三個卷積層構成,每個層具有不同的功能。
我們今天先來介紹他的架構!
SRCNN的架構可以分為以下三個主要步驟:
在輸入模型之前,首先我們對低分辨率的圖像進行雙線性插值等傳統的上采樣方法,讓他的尺寸達到目標高分辨率大小。這一步僅增加像素數量,但不會提升圖像細節。
這一步會由第一層卷積層完成。這一層將上采樣後的圖像作為輸入,並提取局部的圖像特徵。這個過程通過一個 $9 \times 9$ 的卷積核來實現,目的是從低分辨率圖像中提取到有效的圖像結構信息。這層的輸出特徵圖可以捕捉到局部的圖像細節。
第二層卷積層對提取到的特徵來進行非線性映射。這層卷積核大小通常是 $5 \times 5$,並且負責將從第一層提取的低層特徵映射到高層特徵,這一步主要是進一步來學習圖像的更深層次信息。
最後一層卷積層(卷積核為 $5 \times 5$)把經過非線性映射的特徵映射回圖像空間,生成最終的高分辨率圖像。這一步的作用是把特徵圖轉化為重建的高分辨率圖像。